Llama 3.3 70B now available in Amazon SageMaker JumpStart
今天,我们很高兴地宣布 Meta 的 Llama 3.3 70B 已在 Amazon SageMaker JumpStart 中推出。 Llama 3.3 70B 标志着大型语言模型 (LLM) 开发方面取得了令人兴奋的进步,它以更少的计算资源提供了与大型 Llama 版本相当的性能。在本文中,我们将探讨如何在 Amazon SageMaker AI 上高效部署此模型,并使用高级 SageMaker AI 功能实现最佳性能和成本管理。
在 AWS re:Invent 2024 结束后不久,我们采访了数据和 AI 副总裁 Swami Sivasubramanian 博士,听取了他的印象,并深入了解最新的 AWS 创新如何帮助满足客户在构建和扩展变革性生成 AI 应用程序时的实际需求。
How Amazon trains sequential ensemble models at scale with Amazon SageMaker Pipelines
集成模型在 ML 社区中越来越受欢迎。它们通过组合多个模型的预测来生成更准确的预测。管道可以快速用于为集成模型创建端到端 ML 管道。这使开发人员能够构建高度准确的模型,同时保持效率和可重复性。在这篇文章中,我们提供了一个使用管道训练和部署的集成模型的示例。
Implementing login node load balancing in SageMaker HyperPod for enhanced multi-user experience
在本文中,我们探讨了在基于 Slurm 的 HyperPod 集群中跨登录节点实现负载平衡的解决方案。通过在所有可用节点上均匀分布用户活动,这种方法为所有用户提供了更一致的性能、更好的资源利用率和更流畅的体验。我们将指导您完成设置过程,并提供在 HyperPod 集群中实现有效负载平衡的实用步骤。
在本文中,我们探讨了 Clearwater Analytics 在生成 AI 方面的尝试,他们如何使用 Amazon SageMaker 构建解决方案,并深入研究 Clearwater Analytics 如何使用 LLM 利用投资管理领域超过 18 年的经验,同时优化模型成本和性能。
How Twitch used agentic workflow with RAG on Amazon Bedrock to supercharge ad sales
在本文中,我们展示了我们如何创新地构建具有代理工作流和 Amazon Bedrock 上的知识库的检索增强生成 (RAG) 应用程序。我们在基于 Slack 聊天的助手中实施了 RAG 管道,以使 Amazon Twitch 广告销售团队能够快速抓住新的销售机会。
Accelerate analysis and discovery of cancer biomarkers with Amazon Bedrock Agents
Bedrock 多代理协作使开发人员能够构建、部署和管理多个无缝协作的专用代理,以解决日益复杂的业务工作流。在这篇文章中,我们向您展示了 Amazon Bedrock Agents 的代理工作流如何通过自然语言界面帮助研究科学家加速这一旅程。我们定义了一个示例分析管道,特别是针对具有生物标志物临床、基因组学和成像模式的肺癌生存率。我们展示了各种专用代理,包括生物标志物数据库分析师、统计学家、临床证据研究员和医学成像专家与主管代理合作。我们展示了代理的自我审查和规划的高级能力,通过将复杂的任务分解为一系列步骤并展示生成最终答案的思路链,有助于与最终用户建立信任。
在本系列的第 1 部分中,我们介绍了 Amazon SageMaker Python SDK 上新推出的 ModelTrainer 类及其优势,并向您展示了如何在自定义数据集上微调 Meta Llama 3.1 8B 模型。在这篇文章中,我们将介绍 ModelBuilder 类的增强功能,它允许您将模型从 ModelTrainer 无缝部署到 SageMaker 终端节点,并为多种部署配置提供单一界面。
Amazon Q Apps supports customization and governance of generative AI-powered apps
在这篇文章中,我们将研究这些功能如何增强 Amazon Q Apps 的功能。我们探索了新的自定义选项,详细介绍了这些改进如何使 Amazon Q Apps 更易于访问并适用于更广泛的企业客户。我们重点介绍自定义标签、经过验证的应用程序、私人共享和数据收集应用程序(预览)等关键功能。
Answer questions from tables embedded in documents with Amazon Q Business
Amazon Q Business 推出了对表格搜索的支持,您可以使用该功能从 Amazon Q Business 中获取的文档中嵌入的表格中提取答案。表格搜索是 Amazon Q Business 中的一项内置功能,可无缝跨多个域运行,无需管理员或最终用户进行设置。在这篇文章中,我们获取了包含表格的不同类型的文档,并向您展示了 Amazon Q Business 如何响应与表格中的数据相关的问题。
How AWS sales uses Amazon Q Business for customer engagement
2024 年 4 月,我们推出了我们的 AI 销售助理,我们称之为 Field Advisor,由 Amazon Q Business 提供支持,可供销售、营销和全球服务部门的 AWS 员工使用。从那时起,成千上万的活跃用户通过 Field Advisor(我们已将其嵌入到我们的客户关系管理 (CRM) 系统中)以及通过 Slack 应用程序提出了数十万个问题。
Discover insights from your Amazon Aurora PostgreSQL database using the Amazon Q Business connector
在本文中,我们将引导您配置和集成 Amazon Q for Business 与 Aurora PostgreSQL 兼容,以使您的数据库管理员、数据分析师、应用程序开发人员、领导层和其他团队能够快速获得与存储在 Aurora PostgreSQL 数据库中的内容相关的问题的准确答案。
在本文中,我们通过自动执行以下任务来说明生成式 AI 在 Tealium 与 AWS 生成式 AI 创新中心 (GenAIIC) 团队合作中的重要性:1/ 基于由 Amazon Bedrock 提供支持的 Ragas 存储库评估 RAG 系统的检索器和生成的答案,2/ 使用基于 Auto-Instruct 存储库的自动提示工程技术为每个问答对生成改进的指令。指令是指给予模型以指导生成响应的一般方向或命令。这些指令是使用 Amazon Bedrock 上的 Anthropic 的 Claude 生成的,4/ 为基于人机交互的反馈机制提供 UI,以补充由 Amazon Bedrock 提供支持
EBSCOlearning scales assessment generation for their online learning content with generative AI
在本文中,我们说明了 EBSCOlearning 如何与 AWS 生成式 AI 创新中心 (GenAIIC) 合作,利用生成式 AI 的力量彻底改变其学习评估流程。我们探讨了传统问答 (QA) 生成所面临的挑战以及为解决这些挑战而开发的创新型 AI 驱动解决方案。
Pixtral 12B is now available on Amazon SageMaker JumpStart
今天,我们很高兴地宣布,Pixtral 12B (pixtral-12b-2409) 是一款由 Mistral AI 开发的先进视觉语言模型 (VLM),在纯文本和多模式任务中均表现出色,现已通过 Amazon SageMaker JumpStart 向客户提供。您可以使用 SageMaker JumpStart 试用此模型,SageMaker JumpStart 是一个机器学习 (ML) 中心,可访问算法和模型,只需单击一下即可部署这些算法和模型以运行推理。在这篇文章中,我们将介绍如何发现、部署和使用 Pixtral 12B 模型来处理各种现实世界的视觉用例。
借助各种生成式 AIfoundation 模型 (FM) 以及在 AmazonSageMaker 中构建和训练自己的机器学习 (ML) 模型的能力,用户希望以无缝且安全的方式试验和选择能够为其业务带来最大价值的模型。在 ML 的初始阶段 […]
Mistral-NeMo-Instruct-2407 and Mistral-NeMo-Base-2407 are now available on SageMaker JumpStart
今天,我们很高兴地宣布,Mistral AI 的 Mistral-NeMo-Base-2407 和 Mistral-NeMo-Instruct-2407 大型语言模型在文本生成方面表现优异,可通过 Amazon SageMaker JumpStart 供客户使用。在本文中,我们将介绍如何发现、部署和使用 Mistral-NeMo-Instruct-2407 和 Mistral-NeMo-Base-2407 模型来处理各种实际用例。
Advancing AI trust with new responsible AI tools, capabilities, and resources
信任是 AI 采用的基石,我们很高兴在 AWS re:Invent 2024 上宣布新的负责任 AI 工具、功能和资源,这些工具、功能和资源可增强我们的 AI 服务和模型的安全性、保障性和透明度,并帮助支持客户自己的负责任 AI 之旅。